Entrenamiento E2E para sistema TTS basado en tokens discretos y LLM El nuevo marco E2E unifica tokenizador, LLM y FM, logrando un WER del 0.78% y 1.56% en TTS, superando a los sistemas en cascada. 2026-06-16 · 2 min